Veille technologique assistée par la fouille de textes

نویسندگان

  • François Jacquenet
  • Christine Largeron
  • Stéphanie Chapaux
چکیده

Résumé. Le domaine de la veille technologique vise à récolter, traiter, et analyser des informations scientifiques et techniques utiles aux acteurs économiques. Dans cet article, nous proposons d’utiliser des techniques de fouille de textes pour automatiser le processus de traitement des données issues de bases de textes scientifiques. Toutefois, la veille introduit une difficulté inhabituelle par rapport aux domaines d’application classiques des techniques de fouille de textes, puisqu’au lieu de rechercher de la connaissance fréquente cachée dans les données, il faut rechercher de la connaissance inattendue. Les mesures usuelles d’extraction de la connaissance à partir de textes doivent de ce fait être revues. Pour ce faire, nous avons développé le système UnexpectedMiner dans lequel de nouvelles mesures permettent d’estimer le caractère inattendu d’un document. Notre système est évalué sur une base de résumés d’articles dans le domaine de l’apprentissage automatique.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Mémoire organisationnelle appuyée par un cadre ontologique pour l'exploitation des processus d'affaires

RÉSUMÉ. Partant d’un environnement business compétitif, interactif et concurrent, l’entreprise essaye de s’imposer et d’assurer sa survie à travers les affaires qu’elle réalise. Elle va être ainsi amenée à la réutilisation de son capital d’objets et de son savoir-faire déjà acquis auparavant tout en l’adaptant aux nouveaux contextes. Toutefois, la position de l’entreprise par rapport à ses conc...

متن کامل

Vers le prototypage rapide de programmes de fouille de données

Bien que guidées par des problèmes réels, les techniques mises au point dans le cadre de la recherche en fouille de données sont encore peu utilisées et leur mise en œuvre reste confinée à la discrétion de quelques programmeurs spécialistes. Ce ”transfert technologique” est donc freiné par un certain nombre de verrous, parmi lesquels le temps nécessaire à la mise au point des programmes opérati...

متن کامل

Extraction automatique de connaissances pour la décision multicritère. (Automatic Knowledge Extraction pour Multicriteria Decision Making)

Cette application, sans prendre parti, aborde le sujet délicat qu’est l’automatisation cognitive. Elle propose la mise en place d’une chaîne informatique complète pour supporter chacune des étapes de la décision, en particulier la phase d’apprentissage en faisant de la connaissance actionnable (CA) une entité informatique manipulable par des algorithmes. La connaissance est extraite directement...

متن کامل

TLabel: Nouvel opérateur d'agrégation par catégorisation dans les cubes de textes

Résumé. L’analyse en ligne (OLAP) dans les cubes de textes nécessite la définition de nouveaux types d’opérateurs d’analyse appropriés aux données textuelles. En effet, les opérateurs d’agrégation classiques ont montré leur efficacité pour l’analyse en ligne des données numériques, mais ils sont inadaptés pour l’analyse des données textuelles. Dans cet article, nous proposons un nouvel opérateu...

متن کامل

Fouille de textes pour orienter la construction d'une ressource terminologique

Résumé. La finalité de ce papier est d'analyser l'apport de techniques de fouille de données textuelles à une méthodologie de construction d'ontologie à partir de textes. Le domaine d’application de cette expérimentation est celui de l’accidentologie routière. Dans ce contexte, les résultats des techniques de fouille de données textuelles sont utilisés pour orienter la construction d’une ressou...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2004